---
title: "DWH"
date: 2023-06-01T23:22:04+03:00
description: "Заметка о Data Warehouse"
tags: ["dwh"]
ShowToc: true
ShowBreadCrumbs: true
draft: false
---

[Data Warehouse](https://cloud.mts.ru/cloud-thinking/blog/data-warehouse/) — это единое корпоративное хранилище архивных данных из разных источников (систем, департаментов и прочее). Цель Data Warehouse — обеспечить пользователя (компанию и ее ключевых лиц) возможностью принимать верные решения в ключе управления бизнесом на основе целостной информационной картины.

DWH — не только склад важных данных компании, но еще и основа бизнес-аналитики (BI). Именно из корпоративного хранилища компания получает сведения, необходимые для принятия управленческих и стратегических решений.

## Пример DWH

Давайте на простом примере посмотрим, как это работает.

- У крупного интернет-ретейлера зафиксировано снижение продаж. Для решения проблемы привлекается бизнес-аналитик.
- Специалист, получив доступ к DWH, начинает изучать ключевые показатели: размер выручки, количество клиентов, издержки и прочее.
- После этапа изучения аналитик формирует отчет, в котором, на основе полученных из Data Warehouse данных, указаны причины возникновения проблемы. Результат отчета подкрепляется статистической информацией.
- Принимающие решения лица на основе сведений из аналитического отчета, принимают эффективные меры по увеличению уровня продаж, например, корректируют стратегии и политики продвижения продуктов компании.

Корпоративное хранилище позволяет не искать решение вслепую, а выявить источники проблемы. Обычные базы данных просто не позволяют этого сделать, потому что:

- не хранят исторических сведений;
- данные из разных БД хранятся разрозненно, не давая единой информационной картины;
- на поиск и сопоставление информации из обычных БД уйдет внушительное количество времени и других ресурсов.

## Структура DWH

Data Warehouse состоит из нескольких уровней:

- **Область сбора первичных данных.** Сюда стекается информация из разных отделов компании и БД.
- **Ядро.** Вся поступившая в DWH разрозненная информация приводится к нужным структурам и ключам. Именно этот ключевой компонент хранилища обеспечивает целостность и полноту данных.
- **Витрины аналитики.** Данные преобразовываются в массивы, которые удобно использовать для решения конкретных задач. Такие витрины могут быть первичными (помогают решать относительно простые задачи) и вторичными (для сложных аналитических отчетов и нетиповых задач).
- **Сервисный слой.** Отвечает за управление тремя предыдущими уровнями. Обеспечивает мониторинг данных и оперативное устранение ошибок.

## Еще источники

[От Selectel](https://selectel.ru/blog/data-warehouse/)
[От Яндекс](https://cloud.yandex.ru/blog/posts/2022/06/data-warehouse)
[От Mail.ru](https://mcs.mail.ru/blog/chto-takoe-dwh-i-pochemu-bez-nih-dannye-kompanii-bespolezny)
[Хранители данных: как устроена работа с DWH в Lamoda](https://habr.com/ru/companies/lamoda/articles/595811/)